تشخیص برون خطی کلمه دست نوشته فارسی با استفاده از مدل مخفی مارکوف

پایان نامه
چکیده

در این پایان نامه سیستمی برای بازشناسی برون خط کلمات دست‎نویس فارسی ارائه شده است. پیچیدگی نگارش فارسی و شکل متفاوت حروف بسته به موقعیت آن که اول کلمه، وسط کلمه، انتهای کلمه یا جدا از بخش های دیگر کلمه باشد بازشناسی کلمات در این زبان را بسیار دشوار نموده است. بطوریکه درصد بازشناسی روش های موجود کمتر از نرخ مطلوب برای تجاری شدن این سیستم‎ها می باشد. یک سیستم بازشناسی کلمه در حالت کلی شامل مراحل پیش‎پردازش، استخراج ویژگی و کلاسه‎بندی است. در این پایان نامه سه روش جهت بازشناسی پیشنهاد شده و کارایی این روش ها در مقایسه با روش های موجود ارزیابی شده است. به دلیل نبود یک پایگاه داده مناسب و با تعداد تصویر کافی برای ارزیابی کارایی سیستم پیشنهادی، پایگاه داده فارسا، شامل 30000 تصویر از 300 کلمه متداول دست نوشته در زبان فارسی، ایجاد شد. جهت ارزیابی روش های پیشنهادی و مقایسه با روش های موجود 198 کلاس از این پایگاه داده مورد استفاده قرار گرفت. در روش اول تصویر کلمه به پنجره‎های عمودی دارای همپوشانی تقسیم می‎شود و از هر پنجره هیستوگرام کد‎های زنجیره‎ای استخراج می‎شود، هر پنجره یک بردار 20 عنصری را تولید می‎نماید. برای آموزش و ارزیابی hmm گسسته بردار ویژگی‎های استخراج شده از پنجره لغزان، با استفاده از شبکه عصبی نگاشت خود‎سازمانده کوانتیزه می‎شود . برای تعداد حالت‎های مخفی مدل hmmدر هر کلاس کلمه ، کمترین تعداد پنجره‎ برای تصاویر آموزش در هر کلاس بدست می‎آید. تعداد حالت‎های مخفی ضریبی از این مقدار کمینه است. با آزمایش ضرایب مختلف، سیستم در مقدار 8/1 به بهترین نرخ بازشناسی می‎رسد. برای پارامتر‎ هموارسازی روی مقادیر مختلف آزمایش شد، سیستم در مقدار 001/0 به جواب بهتری رسید. اندازه کتاب رمز 49 تنظیم می‎شود. در نهایت روش پیشنهادی اول با تعیین ضرایب بیان شده در بالا به نرخ بازشناسی 57/66% در198 کلاس از پایگاه داده فارسا می‎رسد. در روش پیشنهادی دوم علاوه بر هیستوگرام کد‎های زنجیره‎ای، از ویژگی میانگین بلوکی برای کلاسه‎بندی استفاده می‎شود و ابعاد بردارهای ویژگی به 25 افزایش می‎یابد. نرخ بازشناسی با استفاده از همان ضرایب تنظیم شده در روش اول، 88/68% بدست می‎آید. که افزایش بیش از 2% را نسبت به روش اول نشان ‎می‎دهد. روش پیشنهادی سوم در واقع بکارگیری یک سیستم دو خبره‎ای است. با استفاده از بررسی که روی نتایج ارزیابی روش دوم انجام شد یک مفهوم جدید به نام معیار اطمینان برای کلاسه‎بند hmm معرفی میشود. با مشاهده هیستوگرام اختلاف دو بزرگترین احتمال در خروجی hmm برای تصاویر آزمون یک مقدار آستانه به عنوان معیار اطمینان معرفی می‎شود. تصاویری که شرایط معیار اطمینان را دارند با کلاسه‎بند hmm بازشناسی می‎شوند و تصاویری که این شرایط را ندارند با استفاده از کلاسه‎بند knn بازشناسی می‎شوند. برای کلاسه‎بند knnاز ویژگی‎های ساختاری ، تعداد مولفه‎های متصل تصویر، تعداد مولفه‎های متصل بالای خط کرسی و تعداد مولفه‎های متصل پایین خط کرسی، استفاده می‎شود. کلاسه‎بند knn با استفاده از این ویژگی‎ها و با 11 نزدیک‎ترین همسایه و معیار فاصله بلوک شهری به نرخ بازشناسی 69/61% دست می‎یابد. در این سیستم hmm برای تصاویری که معیار اطمینان را دارند به نرخ بازشناسی 85% دست می‎یابد. در کل نرخ بازشناسی این روش برای 198 کلاس از پایگاه داده فارسا 49/76% است. که نسبت به روش اول افزایش 7% را بدنبال دارد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

تشخیص نفوذ شبکه با استفاده از رویکرد ترکیبی مدل مخفی مارکوف و یادگیری ماشین مفرط

با رشد فناوری اطلاعات، امنیت شبکه به‌عنوان یکی از مباحث چالش‌برانگیز مطرح است. تکنیک‌های تشخیص نفوذ مبتنی بر ناهنجاری یک فناوری ارزشمند برای حفاظت از شبکه‌ها در برابر فعالیت‌های مخرب است. در این مقاله رویکردی جدید مبتنی بر مدل مخفی مارکوف (HMM) و ماشین یادگیری مفرط (ELM) جهت تشخیص نفوذ ارائه شده است. در مدل پیشنهادی، داده‌هایی که از ترافیک شبکه جمع‌آوری شده‌اند، ابتدا پیش‌پردازش می‌شوند. سپس دن...

متن کامل

چهارچوبی جهت تشخیص ژست دست با استفاده از فیلتر کالمن و مدل مخفی مارکوف

هدف از محاوره انسان و کامپیوتر، رسیدن به محاوره ای شبیه به کار انسان با انسان در مورد انسان با کامپیوتر می باشد. ژست ها نقش مهمی را در زندگی روزانه انسان ها جهت انتقال اطلاعات و بیان احساسات بازی می کنند. ژست ها پیامدی از حرکت بخشی از بدن می باشند که یکی از این حرکت های بسیار پرکاربرد حرکت دست می باشد که به عنوان ژست پویای دست شناخته می شود. بنابراین دنبال کردن دست و تشخیص حرکت آن بسیار مهم بود...

15 صفحه اول

بازشناسی برخط زیر-کلمات فارسی بر اساس ویژگی‌های کدهای زنجیره‌ای فریمن با استفاده از ‌ مدل مخفی مارکوف

در این مقاله سعی بر شناسایی برخط زیر-کلمات فارسی با استفاده از کدهای زنجیره‌ای فریمن و مدل مخفی مارکوف شده است. کدهای زنجیره‌ای با استفاده از جهت شکستگی‌ها، ضمن حفظ جهت حرکت قلم، حجم داده‌ها را کاهش می‌دهد. از این‌رو می‌تواند به عنوان یک روش مؤثر در شناسایی برخط زیر-کلمات بکار گرفته شود. پس از شکستن زیر-کلمه به بخش‌های تشکیل‌دهنده (بدنه اصلی و ریزحرکات)، با استفاده از کدهای زنجیره‌ای فریمن، هر ...

متن کامل

تشخیص حرکات دست در زبان اشاره فارسی با استفاده از مدل پنهان مارکوف

حرکات بدن به مجموعه حرکات معنی داری که شامل حرکت فیزیکی انگشت ها، دست ها، بازوها، سر، صورت و یا بدن هست، گفته می شود. این حرکات دو هدف عمده را دنبال می کنند: 1- انتقال اطلاعات. 2- ارتباط با محیط اطراف. از جمله کاربردهای تشخیص حرکات بدن کنترل یک وسیله الکترونیکی با حرکات بدن، ارتباط بین روبات و انسان و تشخیص زبان اشاره است. زبان اشاره اساسی ترین وسیله ارتباطی افراد ناشنواست. هنگام ارتباط یک انسا...

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده برق

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023